#!/usr/bin/env python
# coding: utf-8

# In[2]:


import pandas as pd


# In[5]:


src_data = pd.read_excel(r'D:\Programming\Python\PlayTogether_Data\book1\pokemon.xlsx', 'pokemon_chn')


# In[7]:


print(src_data)


# In[9]:


print(src_data.info())
# 注意：info后面的括号


# In[10]:


# 分析[中文名称, attack, defense, capture_rate, percentage_male, generation]


# In[11]:


new_data = src_data[['中文名称', 'attack', 'defense', 'capture_rate', 'percentage_male', 'generation']]


# In[14]:


# new_data
# 直接打印的排版比print好看。。


# In[15]:


# 精简数据，合并attack和defense为战斗力
new_data['战斗力'] = (new_data.attack + new_data.defense) / 2


# In[16]:


# new_data


# In[17]:


new_data = new_data.drop(['attack', 'defense'], axis=1)


# In[18]:


# new_data


# In[24]:


new_data = new_data.rename(columns = {'percentage_male':'女生比率'})
new_data['女生比率'] = 100 - new_data['女生比率']


# In[25]:


# new_data


# In[26]:


# 按generation分组
df = new_data.groupby('generation').agg('mean')


# In[27]:


# df


# In[31]:


import matplotlib.pyplot as plt


# In[36]:


plt.figure(1)
plt.scatter(df.index, df['战斗力'])
plt.figure(2)
plt.scatter(df.index, df['capture_rate'])
plt.figure(3)
plt.scatter(df.index, df['女生比率'])